期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于短语的维吾尔文文本分类
阿力木江·艾沙 吐尔根·依布拉音 库尔班·吾布力 李哲
计算机应用    2012, 32 (10): 2923-2926.   DOI: 10.3724/SP.J.1087.2012.02923
摘要986)      PDF (618KB)(404)    收藏
文本特征表示是在文本自动分类中最重要的一个环节。在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机(SVM)算法对维吾尔文文本进行了分类实验。实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔文文本分类的准确率和召回率。
参考文献 | 相关文章 | 多维度评价